活动
最新
False
- 概述
- 用户界面自动化
- UI-ANA-016 - 拉取打开浏览器 URL
- UI-ANA-017 - 出错时继续 True
- UI-ANA-018 - 列出 OCR/图像活动
- UI-DBP-006 - 容器使用情况
- UI-DBP-013 - Excel 自动化误用
- UI-DBP-030 - 选取器中的禁止变量使用情况
- ST-DBP-021 - 硬编码超时
- UI-PRR-001 - 模拟单击
- UI-PRR-002 - 模拟键入
- UI-PRR-003 - 打开应用程序误用
- UI-PRR-004 - 硬编码延迟
- UI-REL-001 - 选取器中的大 IDX
- UI-SEC-004 - 选取器电子邮件数据
- UI-SEC-010 - 应用程序/Url 限制
- UI-USG-011 - 不允许的属性
- SY-USG-013 - 私有文件调用
- SY-USG-014 - 执行模板占位符不正确
- 通过用户界面自动化实现自动化的应用程序和技术
- UiPath 浏览器迁移工具
- 计算机视觉录制器
- 单击
- 悬停
- 输入安全文本
- 发送热键
- 键入
- 选中
- 选择项目
- 选择多个项目
- 获取文本
- 设置文本
- 激活
- 高亮显示
- 设置焦点
- 锚点基准
- 上下文感知锚点
- 查找相对元素
- 在屏幕上指定
- 存在元素
- 查找元素
- 等待元素消失
- 查找子元素
- 获取上级
- 元素作用域
- 获取属性
- 设置剪切区域
- 获取位置
- 截取屏幕截图
- 等待属性
- 在元素出现时
- 在元素消失时
- 单击文本
- 悬停文本
- 查找文本位置
- 获取全文
- 获取可见文本
- 提取结构化数据
- 存在文本
- 单击 OCR 文本
- 悬停在 OCR 文本上方
- 获取 OCR 文本
- 查找 OCR 文本位置
- Microsoft OCR
- Microsoft Project Oxford Online OCR
- Microsoft Azure 计算机视觉 OCR
- Tesseract OCR
- Google Cloud Vision OCR
- 存在 OCR 文本
- 单击图像
- 悬停在图像上方
- 查找图像匹配项
- 存在图像
- 查找图像
- 等待图像消失
- 在图像出现时
- 在图像消失时
- 加载图像
- 保存图像
- 附加浏览器
- 关闭选项卡
- 返回
- 前往
- 转至主页
- 注入 JS 脚本
- 导航至
- 打开浏览器
- 刷新浏览器
- 设置网页属性
- 附加窗口
- 关闭窗口
- 获取活动窗口
- 隐藏窗口
- 最大化窗口
- 最小化窗口
- 移动窗口
- 还原窗口
- 显示窗口
- 导出用户界面树
- 调用 ActiveX 方法
- 注入 .NET 代码
- 单击触发器
- 按键触发器
- 单击图像触发器
- 系统触发器
- 热键触发器
- 鼠标触发器
- 获取事件信息
- 监控事件
- 获取源元素
- 重播用户事件
- 阻止用户输入
- 使用前台
- 元素属性更改触发器
- 元素状态更改触发器
- 标注
- 复制选定文本
- 从剪贴板获取
- 设置为剪贴板
- 关闭应用程序
- 打开应用程序
- 启动进程
- 获取密码
- 工具提示
- 单击屏幕上的图片
- 单击工具栏按钮
- 读取状态栏
- 在日历中选择日期
- 选择菜单项
- 展开树
- 调用事务
- SAP 登录
- SAP 登录
- 表格单元范围
- SAP 会话属性更改触发器
- 展开 ALV 树
- 展开 ALV 层次结构表格
- Computer Vision Local Server
- 移动自动化
- 终端
用户界面自动化活动
上次更新日期 2024年4月3日
Google Cloud Vision OCR
UiPath.Core.Activities.GoogleCloudOCR
使用 Google Cloud OCR 引擎从指定的用户界面元素或图像中提取字符串及其信息。 它可以与其他 OCR 活动一起使用,例如 单击 OCR 文本、 双击 OCR 文本、 悬停在 OCR 文本上方、 获取 OCR 文本和 查找 OCR 文本位置。
常见
- “显示名称”- 活动的显示名称。
输入
- 图像 - 要处理的图像。此字段仅支持“图像”变量。
登录
- API 密钥 - 用于访问 Google Cloud OCR 的 API 密钥。
其他
- “私有”- 选中后将不再以“Verbose”级别记录变量和参数的值。
选项
-
检测模式 - 指定要向 Google Cloud Vision OCR 发送的检测标记。选择以下两个选项之一:文本检测和文档文本检测。默认值为文本检测。
重要提示: “文本检测”模式不会报告已识别单词的置信度值。 在“数字化文档”活动中使用 OCR 引擎时,所有单词的所有 OCR 置信度值都将设置为 -1(未知)。 - “提取文字”- 如果选中此复选框,则会提取每个检测到的文字在屏幕上的所处位置。
- 语言 - OCR 引擎从用户界面元素或图像中提取文本所使用的语言。对于 Google OCR 引擎,该字段需要包含语言文件前缀,如表示罗马尼亚语的“rom”、表示意大利语的“ita”以及表示法语的“fra”。您可以在该页面找到支持的语言前缀。
- 根据需要调整尺寸至最大限制 - 选中此项时,引擎会尝试缩小目标图像的尺寸,使其维持在 Google Cloud Vision 引擎的尺寸限制范围内。默认情况下,该复选框处于未选中状态。
-
比例 - 选定用户界面元素或图像的比例因子。数字越大,将图像放大得越大。这样可以更好地读取 OCR,建议小图像使用较大比例因子。如果想要缩小,0 至 1 之间的值也可接受。默认情况下,此值为 2。
重要提示: 当比例因子大于 1 时,大尺寸图像可能会导致错误。
输出
- 文本- 提取的文本。此字段仅支持
string
变量。 - “结果”- 提取的文字及其在屏幕上的位置。此字段仅支持
KeyValuePair<rectangle,string>
变量。